#ajuste fino

Calificación automática de C++ con BART y rúbricas

Descubre cómo mejora la calificación automática de tareas C++ con BART y rúbricas: menor error y distribuciones de notas más realistas.

2026-06-03 · 2 min

BaltiVoice: Corpus de voz y sistema Whisper ASR ajustado para el balti

Descubre BaltiVoice, el primer corpus de voz público para el idioma balti. Ajustamos Whisper y reducimos el error de 182% a 30%. ¡Modelo y demo disponibles!

2026-06-03 · 2 min

Recuperación del modelo del mundo en planificadores LLM ajustados

¿Aprenden los LLM a representar el modelo del mundo al planificar? Este análisis revela cómo el ajuste supervisado codifica la validez de acciones y predicados.

2026-06-03 · 2 min

SEFT: Ajuste fino disperso para LLMs con evolución de la dispersión

Descubre SEFT, un método de ajuste fino que permite a los LLMs dispersos evolucionar su estructura manteniendo eficiencia. Supera a métodos existentes.

2026-06-03 · 2 min

FGRPO: Federated GRPO con Agregación Adaptativa en Datos No IID

FGRPO optimiza modelos de razonamiento con agregación adaptativa en datos no IID, preservando privacidad.

2026-06-03 · 2 min

DECA: Descentralizando el Ajuste Fino Completo de LLMs

Descubre DECA, el ajuste fino completo descentralizado para LLMs con Adam por bloques y datos no IID.

2026-06-03 · 1 min

DECA: Ajuste Fino Completo Descentralizado de LLMs en Datos No IID

Descubre DECA: ajuste fino completo descentralizado de LLMs en datos no IID. Eficiente y rápido. ¡Infórmate!

2026-06-03 · 2 min

ParaBlock: Aprendizaje Federado con Bloques Coordinados en Paralelo

Descubre ParaBlock: una técnica innovadora que acelera el aprendizaje federado de grandes modelos de lenguaje al paralelizar comunicación y computación, manteniendo el rendimiento.

2026-06-03 · 2 min

Poda de redes neuronales profundas mediante la distribución de Marchenko-Pastur

Poda de redes profundas con distribución Marchenko-Pastur: precisión mantenida con mínimo ajuste fino. Resultados en ImageNet con ViT y CNNs.

2026-06-03 · 3 min

Protocolos de evaluación con pruebas de aceptación para LLM empresariales

Aplica protocolos de evaluación basados en pruebas de aceptación para sistemas LLM seguros, confiables y alineados con el negocio.

2026-06-03 · 2 min

GRZO: Optimización de orden cero para ajuste fino de LLMs

Descubre GRZO, el optimizador que reduce la varianza en el ajuste fino de LLMs, mejorando precisión y ahorrando memoria GPU.

2026-06-03 · 3 min

Preentrenamiento de modelos de lenguaje en textos históricos

Descubre TypewriterLM, un modelo de lenguaje de 7.24B parámetros entrenado con textos anteriores a 1913. Supera desafíos de calidad y fuga temporal.

2026-06-03 · 2 min

Ajuste fino de LFM2 con QLoRA y DPO: Tutorial en Google Colab

Aprende a hacer fine-tuning del modelo LFM2 con QLoRA y DPO en Google Colab. Tutorial paso a paso con código abierto. ¡Mejora tu IA!

2026-06-03 · 3 min

Adaptadores Kronecker: la importancia del diseño de componentes

Optimiza el ajuste fino de modelos grandes con adaptadores Kronecker. Conoce CDKA, una nueva técnica que mejora la capacidad y eficiencia mediante el diseño estratégico de componentes.

2026-06-03 · 2 min

Backpropagación Estructurada Eficiente en Memoria para Ajuste Fino de LLM

Descubre MeSP: reduce un 49% la memoria al ajustar LLMs en dispositivos, con gradientes exactos. Ideal para entrenamiento privado.

2026-06-03 · 2 min

MARFT: Ajuste Fino de Refuerzo Multi-Agente

Descubre MARFT, un nuevo marco de ajuste fino por refuerzo multi-agente para optimizar sistemas de agentes LLM. Mejora colaboración y razonamiento.

2026-06-02 · 1 min

GFlowGR: Optimización de Sistemas de Recomendación Generativos con GFlowNets

GFlowGR utiliza GFlowNets para ajustar sistemas de recomendación, mitigando el sesgo de exposición. Mejora diversidad y precisión. Optimiza tu modelo.

2026-06-02 · 1 min

PFT: Ajuste fino de fonones para potenciales interatómicos con IA

Descubre cómo PFT mejora un 55% las propiedades fonónicas de materiales al ajustar potenciales interatómicos con IA. Nuevo estándar en simulaciones.

2026-06-02 · 2 min

Reconsiderando la supervisión posicional en modelos de difusión enmascarada

Los modelos de difusión enmascarada (MDLM) son sensibles a pequeños desplazamientos posicionales. Descubre cómo CTC mejora el ajuste fino y supera a la entropía cruzada en cuatro benchmarks.

2026-06-02 · 2 min

OP-LoRA: La bendición de la dimensionalidad

OP-LoRA mejora el rendimiento de LoRA al añadir MLP temporal que se descarta. Logra hasta 15 puntos más en generación de imágenes.

2026-06-02 · 2 min